ANÁLISIS BIOINFORMÁTICO DE UNA SECUENCIA NO ANOTADA (Secuencia # 3)

ARCILLA ALLER, FRANCISCO
Dpto. Microbiología, Universidad León

Rhodococcus_imag.JPG
  • Origen de la secuencia, primeros análisis:


Microorganismo en cuestión: una especie del género Rhodococcus, comenzamos una primera aproximación con el programa Nebcutter 2.0 y obtenemos marcos de lectura(ORF):

nebcutter.JPG

Tenemos que es Rhodococcus erythropolis, con seguridad de que no fallo de 4x10-84. No es esa especie
LOCUS       YP_002764705             250 aa            linear   BCT 07-MAY-2009
DEFINITION  IclR family transcriptional regulator [Rhodococcus erythropolis
            PR4].
ACCESSION   YP_002764705
VERSION     YP_002764705.1  GI:226304747
DBLINK      Project:[[http://www.ncbi.nlm.nih.gov/sites/entrez?db=genomeprj&cmd=Retrieve&dopt=Overview&list_uids=20395|20395]]
DBSOURCE    REFSEQ: accession [[http://www.ncbi.nlm.nih.gov/nuccore/226303489|NC_012490.1]]
KEYWORDS    .
SOURCE      Rhodococcus erythropolis PR4
  ORGANISM  [[http://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?id=234621|Rhodococcus erythropolis PR4]]
            Bacteria; Actinobacteria; Actinobacteridae; Actinomycetales;
            Corynebacterineae; Nocardiaceae; Rhodococcus.
 
  • Taxonomía del microorganismo:

Reino: Bacteria
Phylum: Actinobacteria
Clase: Actinobacteria
Subclase: Actinobacteridae
Orden: Actinomycetales
Suborden: Corynebacterineae
Familia: Nocardiaceae
Géneros: Rhodococcus

  • Análisis informático de la secuencia con el programa Artemis:


Artemis Overview of: Mi secuencia.txt ORFS_100+
Número de bases: 17000
Genes (CDS features without a /pseudo qualifier):
non-spliced:
count: 84
bases: 67477
density: 4.941 genes per kb (202 bases per gene)
average length: 803
average length (including introns): 803
coding percentage: 396.9
coding percentage (including introns): 396.9

Composición de las secuencias génicas:
A content: 10487 (15.54%)
C content: 23412 (34.69%)
G content: 23227 (34.42%)
T content: 10351 (15.34%)
(no ambiguous bases)
% G+C: 69.12
Overall sequence composition:
A content: 2606 (15.32%)
C content: 5718 (33.63%)
G content: 5970 (35.11%)
T content: 2706 (15.91%)
(no ambiguous bases)
GC percentage: 68.75
Summary of the active entries:
CDS: 84
artemis.png
Todos los posibles marcos de lectura abiertos de la secuencia


De los 84 ORFs los siguientes corresponden a secuencias conocidas:
Dirección 5'-3'

Cadena complementaria
CDS posición
Proteína
3760-4293
Inhibidor de inicio de traducción
1046-1450
Proteína hipotética
4642-6882
Regulador transcripcional IclR
2496-3158
Regulador transcripcional (TetR)
11908-14151
Oxidorreductasa
4026-4637
Regulador transcripcional
1499-2731
Esterasa-lipasa
7006-8688
Oxidasa de L-aminoácidos
3240-3977
Proteína hipotética
8108-9592
Translocasa de proteínas
5385-7049
Transportador de aminoácidos
8646-9392
Endoribonucleasa L-PSP


10273-11733
Transportador MFS


11923-14076
Proteína hipotética conservada


14286-17000
Sub grande de Glu Sintasa


Hemos elegido la Glutamato sintasa


  • Análisis del gen que codifica para la proteína.


Usando el programa FramePlot: ( para qué usa ahora este programa?????)

frameplot.JPG
Este programa se emplea únicamente con microorganismos de alto contenido de G+C, como es el caso y no da información acerca de la capacidad codificadora, en este caso
se trata de un buen marco de lectura (línea 1).


  • Diseño de primers para la amplificación del gen/es por PCR:

Los oligos apropiados para la amplificación del gen serían los siguientes, según el programa Primer3 (v. 4.0) son los siguientes:

Oligo izquierdo:
Oligo
comienzo
longitud
Tm
% GC
3' sec

Izquierdo
604
20
60.43
50.00
2.00
ACGTTCCGTCAGGTGTTCAT
Derecho
838
20
60.01
60.00
2.00
CCTGCAGGTCGAGGTAGAAG
Tamaño secuencia: 2715
Tamaño producto: 235 (la proteína tiene 905 aa, y Ud. está amplificando 235???????)

Además nos proporciona algunos oligos adiccionales:
ADDITIONAL OLIGOS
                    [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_START|start]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_LEN| len]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_TM|     tm]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_GC|    gc%]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_ANY|  any]]  [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_REPEAT|  3']] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_OLIGO_SEQ|seq]]
 
 1 LEFT PRIMER       2168   20   59.58   60.00  4.00  1.00 GTACCAAGGTCGGTCTCGTC
   RIGHT PRIMER      2388   20   59.98   50.00  4.00  1.00 CTTCGACATCACCTTCAGCA
   PRODUCT SIZE: 221, PAIR ANY COMPL: 6.00, PAIR 3' COMPL: 2.00
 
 2 LEFT PRIMER        748   20   59.73   60.00  4.00  1.00 GTGTACTTCCCGAGCCTGTC
   RIGHT PRIMER       897   20   59.70   55.00  2.00  2.00 GAAGGTGTTGGTGGAGAAGC
   PRODUCT SIZE: 150, PAIR ANY COMPL: 4.00, PAIR 3' COMPL: 3.00
 
 3 LEFT PRIMER       2168   20   59.58   60.00  4.00  1.00 GTACCAAGGTCGGTCTCGTC
   RIGHT PRIMER      2387   20   59.84   50.00  4.00  0.00 TTCGACATCACCTTCAGCAC
   PRODUCT SIZE: 220, PAIR ANY COMPL: 6.00, PAIR 3' COMPL: 3.00
 
 4 LEFT PRIMER        604   20   60.43   50.00  4.00  2.00 ACGTTCCGTCAGGTGTTCAT
   RIGHT PRIMER       837   20   60.16   60.00  6.00  2.00 CTGCAGGTCGAGGTAGAAGC
   PRODUCT SIZE: 234, PAIR ANY COMPL: 3.00, PAIR 3' COMPL: 1.00
 

  • Diseño de primers para amplificar fragmentos internos del gen/es y comprobar si dicho gen/es son esenciales o no para el microorganismo.

Empleamos también Primer3plus:
OLIGO            [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_START|start]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_LEN| len]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_TM|     tm]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_GC|    gc%]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_ANY|  any]]  [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_REPEAT|  3']] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_OLIGO_SEQ|seq]]
INTERNAL_OLIGO     819   20   60.01   60.00  8.00  8.00 CTTCTACCTCGACCTGCAGG
 
Otros oligos:
                   [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_START|start]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_LEN| len]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_TM|     tm]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_GC|    gc%]] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_ANY|  any]]  [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_REPEAT|  3']] [[http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www_results_help.cgi#PRIMER_OLIGO_SEQ|seq]]
 1 INTERNAL_OLIGO    2369   20   59.98   50.00  4.00  0.00 TGCTGAAGGTGATGTCGAAG
 2 INTERNAL_OLIGO    2380   20   60.04   50.00  8.00  6.00 ATGTCGAAGATGGGCATCTC
 3 INTERNAL_OLIGO    2379   20   60.04   50.00  8.00  8.00 GATGTCGAAGATGGGCATCT
 4 INTERNAL_OLIGO      58   20   59.95   55.00  4.00  3.00 CTCAACGAGGAGCCATTCTC
 
Para comprobar si se trata de un gen esencial para el microorganismo se puede realizar un experimento de interrupción génica dentro de esa secuencia.(Hágalo....)

  • A continuación obtuvimos el péptido líder, empleando el programa SignalP 3.0 Server de la Universidad Técnica de Dinamarca:

La predicción está basada en el modelo HMM (Hidden Markov Models) para Gram+:
pept_líder.gif
[[code]]
>CDS
Prediction: Signal peptide
Signal peptide probability: 0.672
Max cleavage site probability: 0.532 between pos. 22 and 23
 
  • Diseño de primers para amplificar los genes que codifican para la/s proteína/s de interés con colas de histidina para su rápida purificación


Empleamos un vector pET-28a de Novagen que lleva incorporadas colas de His, empleamos para introducirlo en el microorganismo una enzima de restricción presente en el vector
y que corte en un sitio cercano al gen para luego clonarlo. Los primers serán los mismos que para clonar por PCR.

Las enzimas de restricción que cortan en esta secuencia, a partir del programa Nebcutter son: (para que???)

external image moz-screenshot-2.jpgfinal.JPG

  • Realización de una mutagénesis in vitro del gen Glut Sintasa (porqué ha elegido esta mutación?????)

Los primers elegidos son:

Oligo izquierdo: ACGTTCCGTGTGGTGTTCAT

Oligo derecho: CCTGCAGGTTGAGGTAGAAG


  • ANÁLISIS DE LA PROTEÍNA GLUTAMATO SINTASA:

En primer lugar hallamos la familia de proteínas a las que pertenece:

Programa Pfam


Secuencia de la proteína:

PSETPQSNVAGADVSPVPRLNEEPFSVGAAQCRAGTCSAVVWPSALLVVGASTHTKAVGMKHLPGPQGLYHPA
NEHDACGVAFVVDMHGRRSRDIVEKAITALVNLEHRGAAGSEPNTGDGAGILLQVPDRFLRAVVDFELPAAGA
YATGIAFLPQGDAAADEAAAGVEKIVAEEGLTVLGWREVPTDDSSLGTLARAAMPTFRQVFIGSAGDSVTDMD
LERRAYVIRKRVEHELGESGAGEDGPGRESVYFPSLSGQTFVYKGMLTTPQLKGFYLDLQDDRVESALGLVHS
RFSTNTFPSWPLAHPFRRVAHNGEINTVSGNENWMRAREALIKSDVFGDGALEKIFPICTPGASDTARFDEVL
ELLHLGGRSLPHAVLMMIPEAWERHESMDPARKAFYEYHSALMEPWDGPASVCFTDGTVVGAVLDRNGLRPSR
VWVTDDGLVVMASEVGVLDIAPEKIVRRMRMQPGRMFLVDTAQGRIISDDEIKSELAAEHPYQQWIDEGLVQI
DDLPESKYTYMTHDRVVLRQQIFGFTNEEVNLLVKPMAVTGGEALGSMGTDTPIAVLSARPRMLFDYFQQLFA
QVTNPPLDAIREEIVTSLGGTIGPEADLLTPSAASCRQIVLPQPILHNDDLSKLIHLNDNAKFPHFRSVVVRG
VYPVAQGGEGLRKALDTVRDKVSEAIAGGARIIVLSDRESNEKYAPIPSLLLTAAVHHHLVREKTRTKVGLVV
ESGDAREVHHMAALLGFGASAVNPYMAFETIDELLQSNQLAGLSLDKAVTNYIKAAGKGVLKVMSKMGISTLA
SYTGAQLFQVIGLSQELVDEYFTGLQSNLDGIGLDEIAADVAARHANAYLDRPELRAHRELEVGGEYQWRREG
EYHLFNPDTVFKLQHSTKTGQYEVFKEYT

Se obtienen dos resultados significativos según los cuales esta proteína contiene un dominio GATasa 2 y otro Glu sintasa central:

external image QuerySeq.png

Start
End
From
To
0
GATase_2
Glutamine amidotransferases class-II
Domain
79
453
1
385
760.3
5.9e-235
fs
n/a



5
Glu_syn_central
Glutamate synthase central domain
Domain
528
818
1
301
599.2
4.4e-177
ls
n/a



Se completa información con el KEGG (Kyoto Encyclopedia of Genes and Genomes):

Familia de las Oxidoreductasas;
Actúan en el grupo donador CH-NH2 y utilizan NAD+ o NADP+ como aceptor.


  • Localización más probable de la proteína; empleando el programa PSORTb version 2.0.4 obtenemos lo siguiente:

Cytoplasmic 8.87
CytoplasmicMembrane 0.39
Cellwall 0.01
Extracellular 0.73
Final Prediction:
Cytoplasmic 8.87 Así pues, se trata de una proteína citoplasmática, como era de esperar.


Ruta metabólica en la que participa:

ruta.JPG

  • Corte con peptidasas , con ExPasy Peptide Cutter se obtienen los siguiente sitios de corte:

Nombre de la enzima
No. de cortes
Positions of cleavage sites
Arg-C proteinase
55
19 33 90 91 93 109 131 134 183 197 204 222 223 228 230 247 282 293 309 310 328 330 360 373 389 397 431 435 438 465 466 468 473 483 526 530 571 573 595 621 651 656 669 676 688 695 719 723 736 847 855 859 862 873 874
Asp-N endopeptidase
55
12 76 85 93 119 129 137 157 161 187 188 212 216 218 242 276 279 280 336 340 356 361 393 411 420 429 442 443 456 477 486 487 504 511 512 524 561 576 591 610 632 633 642 672 676 693 733 761 775 821 832 837 842 853 883
Asp-N endopeptidase + N-terminal Glu
119
2 12 21 22 74 76 85 93 96 106 114 119 129 137 139 157 161 162 168 173 174 183 187 188 212 216 218 220 231 233 236 241 242 247 276 279 280 283 315 323 330 336 340 344 356 361 362 365 384 387 390 393 401 408 411 420 429 442 443 451 456 460 477 486 487 488 492 496 504 505 511 512 515 524 538 539 553 561 576 591 595 596 608 610 632 633 642 665 672 676 680 693 695 698 719 730 733 736 758 761 762 775 818 821 822 832 837 838 842 853 856 862 864 868 874 876 883 898 902
BNPS-Skatole
9
42 182 302 326 387 411 440 503 872
CNBr
22
60 87 200 218 265 327 381 382 393 408 449 467 469 474 522 548 559 574 741 756 794 797
Chymotrypsin-high specificity (C-term to [FYW], not before P)
57
25 70 83 132 139 147 153 182 203 207 225 251 260 262 274 275 294 308 339 361 387 400 401 403 411 419 440 475 500 503 519 521 534 536 576 578 579 583 650 701 747 755 758 782 805 811 824 825 852 870 872 878 881 887 898 901 904
Chymotrypsin-low specificity (C-term to [FYWML], not before P)
181
20 25 46 47 54 60 62 69 70 83 87 88 103 106 108 125 126 132 133 139 147 153 177 180 182 192 195 203 207 218 220 225 233 235 251 255 260 262 265 266 271 274 275 276 278 287 289 291 294 304 308 313 327 333 339 344 361 365 367 368 369 370 377 380 381 382 387 390 393 400 401 403 404 407 408 411 419 429 434 440 446 449 456 467 469 474 475 476 494 500 503 508 519 521 522 529 534 536 543 544 548 556 559 568 574 575 576 578 579 582 583 591 602 612 613 630 631 635 638 640 641 649 650 668 672 692 701 707 708 709 714 715 716 717 728 739 741 744 745 747 755 756 758 764 765 770 773 775 782 791 794 797 802 805 810 811 816 820 824 825 828 832 837 848 852 853 858 861 864 870 872 878 879 880 881 887 889 891 898 901 904
Clostripain
55
19 33 90 91 93 109 131 134 183 197 204 222 223 228 230 247 282 293 309 310 328 330 360 373 389 397 431 435 438 465 466 468 473 483 526 530 571 573 595 621 651 656 669 676 688 695 719 723 736 847 855 859 862 873 874
Formic acid
55
13 77 86 94 120 130 138 158 162 188 189 213 217 219 243 277 280 281 337 341 357 362 394 412 421 430 443 444 457 478 487 488 505 512 513 525 562 577 592 611 633 634 643 673 677 694 734 762 776 822 833 838 843 854 884
Glutamyl endopeptidase
64
3 22 23 75 97 107 115 140 163 169 174 175 184 221 232 234 237 242 248 284 316 324 331 345 363 366 385 388 391 402 409 452 461 489 493 497 506 516 539 540 554 596 597 609 666 681 696 699 720 731 737 759 763 819 823 839 857 863 865 869 875 877 899 903
Hydroxylamine
2
314 432
Iodosobenzoic acid
9
42 182 302 326 387 411 440 503 872
LysC
29
56 61 98 170 229 263 272 335 346 398 462 491 518 546 637 646 670 678 700 721 725 777 784 788 792 796 888 894 902
LysN
29
55 60 97 169 228 262 271 334 345 397 461 490 517 545 636 645 669 677 699 720 724 776 783 787 791 795 887 893 901
NTCB (2-nitro-5-thiocyanobenzoic acid)
6
31 36 78 350 417 619
Pepsin (pH1.3)
230
20 24 42 45 46 46 47 68 69 69 82 83 102 103 105 106 124 125 125 126 132 132 138 139 141 146 147 152 154 176 177 179 180 181 182 191 192 194 195 203 207 219 220 234 250 252 255 259 260 261 262 266 271 273 275 275 276 277 278 286 287 288 289 294 299 302 303 307 325 326 333 338 339 343 344 361 364 365 366 367 367 368 369 370 380 386 387 401 402 403 407 410 418 419 428 429 439 445 446 455 456 474 476 494 499 502 503 507 508 514 518 519 521 529 533 534 535 536 542 543 543 544 555 556 567 568 574 576 577 578 578 579 581 582 582 583 601 602 611 612 612 625 630 634 635 637 638 640 641 647 650 659 667 668 691 692 700 707 707 708 708 709 728 743 744 744 745 746 747 754 757 758 763 764 764 765 769 770 772 773 774 775 781 782 791 801 802 804 805 809 810 810 811 815 816 819 820 823 824 824 825 827 828 831 832 836 837 851 852 852 853 858 869 870 871 872 877 878 879 880 880 886 887 888 889 897 898 900 901 903
Pepsin (pH>2)
182
20 24 45 46 46 47 68 69 82 83 102 103 105 106 124 125 125 126 132 132 138 139 141 152 154 176 177 179 180 191 192 194 195 203 207 219 220 234 252 255 259 260 266 271 273 275 276 277 278 286 287 288 289 294 299 303 307 333 338 339 343 344 361 364 365 366 367 367 368 369 370 380 407 418 419 428 429 445 446 455 456 474 476 494 507 508 514 529 533 534 535 536 542 543 543 544 555 556 567 568 574 576 578 579 581 582 582 583 601 602 611 612 612 625 630 634 635 637 638 640 641 647 650 667 668 691 692 707 707 708 708 709 728 743 744 744 745 746 747 757 758 763 764 764 765 769 770 772 773 774 775 791 801 802 809 810 810 811 815 816 819 820 824 825 827 828 831 832 836 837 852 853 858 879 880 880 886 887 888 889 900 901
Proline-endopeptidase [*]
7
72 307 436 499 547 572 856
Proteinase K
409
4 9 10 12 14 17 20 25 27 29 30 34 36 39 40 41 42 45 46 47 48 49 51 53 55 57 58 63 69 70 73 78 81 82 83 84 85 95 96 99 100 101 102 103 104 106 111 112 118 122 124 125 126 128 132 133 135 136 137 139 141 143 144 146 147 148 149 151 152 153 154 159 160 161 164 165 166 168 171 172 173 177 178 179 180 182 185 187 192 194 195 196 198 199 202 203 206 207 208 211 215 216 220 224 225 226 227 231 235 240 250 251 252 255 259 260 261 262 266 267 268 271 274 275 276 278 283 286 287 289 290 294 296 298 299 302 304 305 308 311 312 317 319 320 326 329 332 333 334 338 339 343 344 347 348 350 352 355 358 359 361 364 365 367 368 370 375 378 379 380 383 386 387 396 399 400 401 403 406 407 411 415 417 419 420 423 424 425 427 428 429 434 439 440 441 442 446 447 448 450 453 455 456 458 459 463 464 475 476 477 479 480 484 485 490 494 495 496 500 503 504 508 509 511 514 519 520 521 523 527 528 529 533 534 536 537 541 543 544 545 549 550 551 555 556 561 563 565 566 567 568 570 575 576 578 579 582 583 584 586 587 591 593 594 598 599 600 602 605 606 610 612 613 614 617 618 623 624 625 629 630 635 638 639 641 645 647 650 653 654 655 658 659 661 662 668 671 672 674 675 679 682 683 684 687 689 690 691 692 701 702 704 707 708 709 710 711 712 713 717 718 722 724 726 728 729 730 735 738 742 743 744 745 747 749 751 752 755 757 758 760 761 764 765 770 771 773 775 778 779 780 782 783 785 786 790 791 793 799 801 802 803 805 806 808 810 811 813 814 816 820 821 824 825 826 828 832 835 837 840 841 842 844 845 846 849 851 852 853 858 860 864 866 870 872 878 880 881 885 886 887 889 893 895 898 900 901 904 905
Staphylococcal peptidase I
60
3 22 75 97 107 115 140 163 169 174 184 221 232 234 237 242 248 284 316 324 331 345 363 366 385 388 391 402 409 452 461 489 493 497 506 516 539 554 596 609 666 681 696 699 720 731 737 759 763 819 823 839 857 863 865 869 875 877 899 903
Thermolysin
295
8 9 11 19 24 26 28 29 33 38 39 40 44 45 46 47 48 50 56 57 59 68 72 80 81 82 83 84 95 98 99 101 102 103 105 110 111 121 123 124 125 131 132 134 135 136 142 143 145 147 150 151 152 159 160 164 165 167 170 171 172 176 178 179 191 194 195 197 198 202 205 206 207 210 214 223 225 226 230 239 249 254 259 260 264 265 270 273 275 282 285 286 288 289 293 303 304 307 310 311 319 326 328 332 333 338 342 343 346 349 354 358 360 364 367 369 377 378 379 380 381 392 395 398 399 405 406 407 414 416 418 423 424 426 427 428 433 438 440 445 446 447 448 449 454 455 462 463 466 468 473 474 475 476 479 483 484 494 495 503 507 508 510 521 526 527 528 532 533 535 542 543 544 547 548 549 555 558 564 565 566 567 569 573 574 575 578 581 582 583 585 590 593 598 601 605 612 616 617 622 623 628 629 637 638 640 644 649 652 653 654 657 660 661 667 670 671 674 678 682 683 686 688 689 690 691 706 707 708 710 711 712 716 717 725 727 728 729 740 741 742 743 744 746 748 750 751 755 756 757 760 764 769 770 772 774 777 778 782 784 785 789 790 792 793 796 798 801 802 807 809 810 812 813 815 820 824 827 831 834 836 840 841 844 845 848 850 852 859 879 880 885 886 888 900
Trypsin
80
19 33 56 61 90 91 93 98 109 131 134 170 183 197 204 222 223 228 229 230 247 263 272 282 293 309 310 328 330 335 346 360 373 389 397 398 431 438 462 465 466 468 473 483 491 518 526 530 573 595 621 637 646 651 656 669 670 676 678 688 695 700 719 721 723 725 736 777 784 788 792 796 847 859 862 873 874 888 894 902


  • Propiedades fisico-químicas de la proteína (ExPaSy ProtParam tool):

**Número de aminoácidos:** 905
 
**Peso molecular:** 98552.6
 
**pI teórico:** 5.27
 
 
Composition de aminoácidos:
Ala (A) 93 10.3%
Arg (R) 55 6.1%
Asn (N) 24 2.7%
Asp (D) 55 6.1%
Cys (C) 6 0.7%
Gln (Q) 31 3.4%
Glu (E) 64 7.1%
Gly (G) 79 8.7%
His (H) 28 3.1%
Ile (I) 37 4.1%
Leu (L) 87 9.6%
Lys (K) 29 3.2%
Met (M) 22 2.4%
Phe (F) 33 3.6%
Pro (P) 49 5.4%
Ser (S) 54 6.0%
Thr (T) 47 5.2%
Trp (W) 9 1.0%
Tyr (Y) 23 2.5%
Val (V) 80 8.8%
Pyl (O) 0 0.0%
Sec (U) 0 0.0%


Total de residuos cargados negativamente (Asp + Glu): 119
Total de residuos cargados positivamente (Arg + Lys): 84

Composición atómica:

Carbon C 4370
Hydrogen H 6871
Nitrogen N 1219
Oxygen O 1323
Sulfur S 28

Formula: C4370H6871N1219O1323S28
Total de átomos: 13811

Índice de estabilidad: 33.71; la proteína es estable.

Índice alifático: 89.35

Hidrofobicidad (GRAVY): -0.148

  • Aparecen algunos dominios coiled-coil: (no son dominios coiled-coils)
coiled.JPG

  • Análisis filogenético. (donde está su secuencia??? el arbol no se entiende si no pone los nombres de las especies...)


Con el programa ClustalW y Mega 4.1 obtuvimos un dendrograma Neighbour-joining de la proteína comparada con otras similares:

MEGAA.JPG


  • Informe final: muy pobre y sin bibliografía)

Se ha realizado un estudio bioinformático de parte de una secuencia de un microorganismo que ha resultado ser del género rhodococcus. De esta secuencia de 17000pb
hemos obtenido mediante el programa Artemis los ORFs, todos los cuales (de un mínimo de 100pb) hemos verificado la proteína para la cual codifican, de los 84 obtenidos inicialmente
únicamente 15 codificaban para alguna proteína (al menos con la información de la bate de datos actual (BLAST).
De dichas proteínas hemos centrado el estudio en la Glutamato Sintasa (subunidad grande), proteína que interviene en la siguiente reacción:

reacción.JPG
2 L-glutamate + NADP+ = L-glutamine + 2-oxoglutarate + NADPH + H+ (porqué no define los números C00025, c0005....)

Se trata de una proteína perteneciente a la familia de las oxidorreductasas y contiene un dominio GATasa 2 y otro Glu sintasa central (Pfam, Sanger Institute y KEGG).
Es una flavoproteína Hierro-Azufre, en la reacción inversa puede actuar el amonio en lugar de la glutamina pero más lentamente.
Interviene en el metabolismo del Glutamato, Nitrógeno y en otras vías metabólicas.

Se confirmó que en efecto se trata de una proteína citoplasmática [PSORTb v.2.0: J.L. Gardy, M.R. Laird, F. Chen, S. Rey, C.J. Walsh, M. Ester, and F.S.L. Brinkman (2005)].
Es además una proteína hidrófila con mayor contenido de cargas negativas.
En el análisis de la secuencia proteica se obtuvo que es cortado con un gran número de peptidasas y contiene algún dominio coiled-coil [
COILS, Lupas, A., Van Dyke, M., and Stock, J. (1991)].
Asimismo se obtuvo un %G+C en la secuencia de 67.8 [FramePlot 2.3.2].


Bibliografía:

Applied and Environmental Microbiology, April 2001, p. 1412-1417, Vol. 67, No. 4
Muscatello, G., Gilkerson, J. R., Browning, G. F. (2009). Detection of Virulent Rhodococcus equi in Exhaled Air Samples from Naturally Infected Foals. J. Clin. Microbiol. 47: 734-737

Agradecimientos:

Al departamento de Microbiología de la Universidad de León y al Dr. J. Antonio Gil